期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. Spark下的分布式粗糙集属性约简算法
章夏杰, 朱敬华, 陈杨
《计算机应用》唯一官方网站    2020, 40 (2): 518-523.   DOI: 10.11772/j.issn.1001-9081.2019091642
摘要434)   HTML3)    PDF (560KB)(294)    收藏

属性约简(特征选择)作为数据预处理的重要环节,大多以属性依赖作为筛选属性子集的标准。设计了一种快速依赖计算方法FDC,通过直接寻找基于相对正域的对象来计算依赖度,而不需要预先求出相对正域,相比传统方法在速度上有明显的性能提升。另外,改进鲸鱼优化算法(WOA)使其能够有效应用于粗糙集属性约简。结合上述两个方法,提出一种基于Spark的分布式粗糙集属性约简算法SP-WOFRST,并在两组人工合成的大数据集上与另一种基于Spark的粗糙集属性约简算法SP-RST进行对比实验。实验结果表明所提出的SP-WOFRST算法在精度和速度上均优于SP-RST。

图表 | 参考文献 | 相关文章 | 多维度评价